11 research outputs found

    Approche logique de grammaires pour les langues naturelles

    Get PDF
    Les contributions majeures de cette thèse s’articulent autour des trois axes de base de la linguistique computationnelle, à savoir la logique, la linguistique et l’informatique. Nous proposons ainsi un nouveau système non-directionnel GLE permettant de simuler les opérations transformationnelles du Programme Minimaliste dans un cadre logique qui fait appel au raisonnement hypothétique de manière contrôlée. La pertinence de ce formalisme est soulignée en montrant sa capacité de prendre en charge des phénomènes linguistiques complexes, nécessitant un partage contraint de ressources, tels que le liage d’anaphores ou la résolution d’ellipse. En outre, nous présentons un atelier logique ICHARATE destiné à la recherche et l’enseignement de la linguistique computationnelle. Cet outil est composé de bibliothèques pour l’assistant à la démonstration Coq, qui comprennent la formalisation de systèmes logiques avancés dédiés au traitement des langues naturelles, dont la logique multimodale.The major contributions of this thesis are articulated around the three basic axes of computational linguistics, namely logic, linguistics and computer science. We propose a new undirected system GLE which allows to simulate the transformational operations of Minimalist Program within a logical setting. The relevance of this formalism is underlined by showing its ability to deal with complex linguistic phenomena, requiring constrained resource sharing, such as anaphora binding or ellipsis resolution. Moreover, we present a logical framework ICHARATE intended for the study of computational linguistics. This tool is composed of libraries, built upon the Coq proof assistant, which include the formalization of advanced logical systems dedicated to natural language analysis, such as multimodal logic

    Towards a Logical Approach to Nominal Sentences Analysis in Standard Arabic

    Get PDF
    12Standard Arabic (SA) is an extremely rich natural language that has unfortunately received very little interest within computational linguistics literature. We propose in this paper to explore this fertile ground and show the first steps towards the formalization of Arabic syntax and semantics by means of MultiModal Categorial Grammars. We will particularly focus on the analysis of some phenomena related to nominal sentences construction in SA using relevant packages of lexically anchored structural rules

    Ellipse et coordination dans les grammaires de type logique

    Get PDF
    International audienceLes grammaires catégorielles (Lambek, Steedmann, Moortgat, Morrill) font partie d'un paradigme d'analyse des langues naturelles dit 'logiques sous-structurelles', i.e. logiques sensibles à la quantité et l'ordre des ressources disponibles. Elles ont théoriquement la souplesse pour gérer la manière dont nous utilisons cognitivement les ressources. Ces logiques bi-directionnelles ont accordé une grande importance à la non-commutativité des ressources (voire parfois à la non-associativité), confondant ainsi les deux niveaux de la grammaire, qualifiés de tectogrammatique (syntaxe abstraite) et phénogrammatique (forme phonologique) par Curry (1961). Ces logiques relativement rigides ne sont pas idéales pour traiter les phénomènes non linéaires et/ou non périphériques tels l'ellipse et la coordination. Plusieurs auteurs (Oehrle, Muskens) ont proposé d'en revenir à des systèmes commutatifs afin de pallier à la rigidité des systèmes bi-directionnels : le fardeau de l'ordre des mots est ainsi délégué au niveau proprement " phonologique ", tandis que l'agencement des catégories reste bien l'objet d'une logique. C'est dans cette orientation que nous nous situons ici

    A New Practical Approach to Automatically Generate the Trending Topics in Morroccan Society using the Social Network Twitter

    Get PDF
    Social networks are taking an increasingly important place in the field of communication within our society. The most used are Twitter, Facebook, Instagram, Tumblr, Dribble, LinkedIn, and Google+. Twitter is a popular social network where connected users can publish short messages limited to 140 characters called “tweets” in which users can share thoughts, post links or images. Twitter has gained wide popularity in Arab world and especially Morocco due to its simplicity of use and services offered by its platform, this information revolution in our society leads to an accumulation of a vast quantity of data that may contain a lot of valuable information. Analyzing these tweets of Moroccan users come with challenges because Moroccan users use a variety of languages and dialects, such as Standard Arabic, Moroccan Arabic called “Darija”, Moroccan Amazigh dialect called “Tamazight”, French, English and more. In addition, the tweets of Moroccan users contain a lot of abbreviations, #hashtags, URLs, spelling mistakes, reduced syntactic structures, and many abbreviations. In this paper, we propose a new approach to determine, from the data sent on Twitter, the subjects that interest Moroccan society and then locate on the Moroccan map the areas from where come the tweets related to these topics. Our proposed approach is based on a distributed system, which contains four main components: the Hadoop framework, the natural language processing, the clustering algorithm k-means, and a tool for plotting tweets graphically on Moroccan map. The first task of this system is to automatically extract the tweets. Next, it stores them in a distributed file system using HDFS (Hadoop Distributed File System) of Apache Hadoop framework. Then we process this raw data and analyze it by using a distributed program using MapReduce of Hadoop framework, Python language, and Natural Language Processing (NLP) techniques. Afterward, we use a text mining technique, called TF-IDF (Term Frequency-Inverse Document Frequency), to convert the corpus generated by the previous step into a vector representation, where each dimension of the vector corresponds to a word, and then we implement the kmeans algorithm to cluster all words into topics. Finally, we graphically plot the topics on the Moroccan map by using the coordinates extracted from tweets, in order to discover the relation between the discovered topics and located Moroccan area

    Approche logique des grammaires pour les langues naturelles

    No full text
    The major contributions of this thesis are articulated around the three basic axes of computational linguistics, namely logic, linguistics and computer science. We propose a new undirected system GLE which allows to simulate the transformational operations of the Minimalist Program within a logical setting. The relevance of this formalism is underlined by showing its ability to deal with complex linguistic phenomena, requiring constrained resource sharing, such as anaphora binding or ellipsis resolution. Moreover, we present a logical framework, called ICHARATE, intended for the study of computational linguistics. This tool is composed of libraries, built upon the Coq proof assistant, which include the formalization of advanced logical systems dedicated to natural language analysis, such as multimodal logic.Les contributions majeures de cette thèse s'articulent autour des trois axes de base de la linguistique computationnelle, à savoir la logique, la linguistique et l'informatique. Nous proposons ainsi un nouveau système non-directionnel GLE permettant de simuler les opérations transformationnelles du Programme Minimaliste dans un cadre logique qui fait appel au raisonnement hypothétique de manière contrôlée. La pertinence de ce formalisme est soulignée en montrant sa capacité à prendre en charge des phénomènes linguistiques complexes, nécessitant un partage contraint de ressources, tels que le liage d'anaphores ou la résolution d'ellipse. En outre, nous présentons un atelier logique, nommé ICHARATE, destiné à la recherche et l'enseignement de la linguistique computationnelle. Cet outil est composé de bibliothèques pour l'assistant à la démonstration Coq, qui comprennent la formalisation de systèmes logiques avancés dédiés au traitement des langues naturelles, dont la logique multimodale

    Ellipse et coordination en grammaire logique

    No full text
    International audienceLe formalisme décrit dans ce papier s'inspire de la théorie chomskyenne des transformations généralisées Merge et Move. Il s'agit d'un merge chaque fois qu'on réunit deux nœuds sous la même racine et il s'agit d'un move, plus ou moins déguisé, chaque fois que l'on procède au déchargement d'une hypothèse. L'introduction de l'exponentielle " ! " d'après les travaux de la logique linéaire (Girard, 1987) permet d'envisager des déplacements simultanés fondamentaux dans les processus d'ellipse et de coordination. En ce sens, c'est introduire une part de parallélisme dans le calcul de la structure linguistique

    Approche logique des grammaires pour les langues naturelles

    No full text
    Les contributions majeures de cette thèse s'articulent autour des trois axes de base de la linguistique computationnelle, à savoir la logique, la linguistique et l'informatique. Nous proposons ainsi un nouveau système non-directionnel GLE permettant de simuler les opérations transformationnelles du Programme Minimaliste dans un cadre logique qui fait appel au raisonnement hypothétique de manière contrôlée. La pertinence de ce formalisme est soulignée en montrant sa capacité de prendre en charge des phénomènes linguistiques complexes, nécessitant un partage contraint de ressources, tels que liliage d'anaphores ou la résolution d'ellipse. En outre, nous présentons un atelier logique ICHARTE destiné à la recherche et l'enseignement de la linguistique computationnelle. Cet outil est composé de bibliothèques pour l'assistant à la démonstration Coq, qui comprennent la formalisation de systèmes logiques avancés dédié au traitement des langues naturelles, dont la logique multimodale.BORDEAUX1-BU Sciences-Talence (335222101) / SudocBORDEAUX1-Bib Rech. Maths-Info (335222209) / SudocSudocFranceF

    Ellipse et coordination en grammaire logique

    No full text
    International audienceLe formalisme décrit dans ce papier s'inspire de la théorie chomskyenne des transformations généralisées Merge et Move. Il s'agit d'un merge chaque fois qu'on réunit deux nœuds sous la même racine et il s'agit d'un move, plus ou moins déguisé, chaque fois que l'on procède au déchargement d'une hypothèse. L'introduction de l'exponentielle " ! " d'après les travaux de la logique linéaire (Girard, 1987) permet d'envisager des déplacements simultanés fondamentaux dans les processus d'ellipse et de coordination. En ce sens, c'est introduire une part de parallélisme dans le calcul de la structure linguistique

    Using AraGPT and ensemble deep learning model for sentiment analysis on Arabic imbalanced dataset

    Get PDF
    With the fast growth of mobile technology, social media has become important for people to share their thoughts and feelings. Businesses and governments can make better strategic decisions when they know what the public thinks. Because of this, sentiment analysis is an important tool for figuring out how different people’s opinions are. This article presents a deeplearning ensemble model for sentiment analysis. The ensemble model proposed consists of three deep-learning models, Gated Recurrent Unit (GRU), Long Short-Term Memory (LSTM), and Bidirectional LSTM (BiLSTM), as base classifiers. AraBERT is responsible for presenting the textual input data into representative embeddings. The stacking ensemble model then captures the long-range dependencies in the embedding for a given class. As a meta-classifier, Support Vector Machine (SVM) then combines the predictions made by the stacking deep learning model. In addition, data augmentation with AraGPT was implemented to address the imbalanced dataset issues. The experimental results demonstrate that the proposed model outperforms the state-of-the-art models with an accuracy of 88.89%, 90.88%, and 88.23% on the HARD, BRAD, and Twitter datasets, respectively
    corecore